图像动漫_第5页

INRIA团队：如何让AI理解复杂空间关系生成图像？

在2025年5月，法国国家信息与自动化研究所（INRIA）、巴黎高等师范学院和法国国家科学研究中心（CNRS）的研究团队 Zeeshan Khan、Shizhe Chen 和 Cordelia Schmid 联合发布了一项令人瞩目的研究成果：ComposeAn

llm 图像先验 inria inria团队 2025-06-05 23:58 6

在线教程｜新加坡国立大学发布OmniConsistency ，实现图像风格迁移

图像风格化旨在通过风格化模型，将一幅图像在保持语义内容不变的同时从一种风格转换到另一种风格。近年随着扩散模型的出现，主流图像风格化方法从基于深度神经网络，转向了通过低秩适配（Low-Rank Adaptation, LoRA）微调的方法，并结合图像一致性模块，

风格化图像 rtx omniconsistency 图像风 2025-06-05 21:21 7

“危机时代”语境下弗里德里希的橡树图像研究

卡斯帕·大卫·弗里德里希是德国浪漫主义的代表风景画家之一，有着枯败生命姿态的橡树图像贯穿了他一生的创作，但目前学界尚缺乏对其橡树图像的系统研究。本文将在“危机时代”的语境下，运用图像学与文献研究法，梳理弗里德里希笔下“英雄式”橡树图像生成的历史脉络；综合19世

图像危机橡树弗里德里希橡树图像 2025-06-05 13:08 6

李公明︱一周书记：从图像中发现……天文学家的椅子及社会文化史

德国雷根斯堡大学科学史教授奥马尔·纳西姆（Omar W. Nasim）的《天文学家的椅子：19世纪的科学、设计与视觉文化》（The Astronomoer’s Chair: A Visual and Cultural History，2021；高旭东译，中信出

图像天文观测西姆文化史李公明 2025-06-05 12:40 8

图像生成：图像生成如何用“场景渗透”驱动AIGC产业爆发？

近期小行深刻感受到图像生成正经历一场“技术革命”。从Black Forest Labs发布的FLUX.1 Kontext模型实现像素级图像编辑，到OpenAI图像生成API新增实时流式预览与多轮编辑功能，技术突破正不断刷新创作效率上限。更值得关注的是，开源社区

aigc nvidia 图像万兴 aigc产业 2025-06-04 15:59 8

重新排列图像块，提升视觉模型性能：加州大学伯克利分校研究突破

在使用图像识别的世界里，你是否曾想过：人工智能是如何"看"图片的？当你的手机识别出照片中的猫咪，或者自动驾驶汽车识别出道路标志时，背后发生了什么？今天，我们要聊一项来自加州大学伯克利分校的有趣研究，它可能会改变我们构建这些视觉模型的方式。

模型图像视觉伯克利主序 2025-06-04 16:25 13

智能标志桩图像监测装置：洞察危险的 “电子眼”

在城市基础设施的地下世界里，地埋高压线缆、燃气管道、通信光缆等如同城市的 “地下脉络”，承载着能源输送、信息传递等关键功能，维系着城市的正常运转。然而，自然灾害的侵袭、重物堆积的压力、违章施工的破坏，时刻威胁着这些地下设施的安全，一旦发生地埋线缆扭曲、变形甚至

监测智能图像电子眼特力康 2025-06-04 11:44 8

2025 年中国多模态大模型行业模型现状图像、视频、音频、3D 模型等终将打通和融合

行业主要上市公司：阿里巴巴 ( 09988.HK，BABA.US ) ; 百度 ( 09888.HK，BIDU.US ) ; 腾讯 ( 00700.HK， TCEHY ) ;科大讯飞 ( 002230.SZ ) ;万兴科技 ( 300624.SZ ) ;三六零

模型模态图像音频 3d模型 2025-06-03 18:00 10

公告丨公共安全视频图像信息系统管理有新规定啦！请查收！

第二条本条例所称公共安全视频图像信息系统（以下简称公共安全视频系统），是指通过在公共场所安装图像采集设备及相关设施，对涉及公共安全的区域进行视频图像信息收集、传输、显示、存储的系统。

视频公告管理图像公安 2025-06-03 17:23 7

令人难忘的图像展示了火星表面的火卫二

你唯一能听到的声音就是风的低语。这里没有拥挤的人群，也没有什么喧嚣（除非你碰巧被困在火星狂野的全球沙尘暴中）。然而，毅力号从杰泽罗陨石坑的孤寂有利位置拍摄的一张新照片，似乎传达了火星上无与伦比的宁静。

图像火星火卫一火星表面火卫二 2025-06-03 07:09 10

Flux.1 Kontext：用文字编辑图像

FLUX.1 Kontext 是来自 Black Forest Labs 的一款新图像编辑模型。它是用于通过文本提示编辑图像的最佳模型之一，并且是 FLUX.1 家族的最新成员。

图像 replica 文字编辑 kontext 文字编辑图像 2025-06-02 17:27 9

极低成本，复现GPT-4o图像风格化一致性！

不久前，GPT-4o 的最新图像风格化与编辑能力横空出世，用吉卜力等风格生成的效果令人惊艳，也让我们清晰看到了开源社区与商业 API 在图像风格化一致性上的巨大差距。

风格化图像 flux i2i 图像风格化 2025-06-01 20:18 6

厉剑：民国教材封面中的儿童图像与现代物品

民国教材封面的图像中，常常有象征现代生活的物品，如黑板、地球仪、收音机、火车、轮船等伴随儿童形象出现，这些物品或与教学活动相关，或与日常生活相关，体现出民国现代教育置身其间的现代化社会空间。以下从新式教具、现代电器两个方面解析民国封面儿童图像及其相关物品。

儿童民国教材图像厉剑 2025-06-01 20:14 7

美服数字科技申请基于人工智能的直播带货商品推送方法专利，快速生成虚拟主播图像用于直播推流

国家知识产权局信息显示，美服数字科技（广州）有限公司申请一项名为“一种基于人工智能的直播带货商品推送方法”的专利，公开号CN120075484A，申请日期为2025年02月。

直播主播人工智能图像专利 2025-05-31 12:21 7

BFL发布FLUX.1 Kontext套件，AI图像生成与编辑速度或领跑业界

近日，科技新闻界传来了一则关于Black Forest Labs（简称BFL）的创新消息。据悉，该公司推出了一款名为FLUX.1 Kontext的全新AI模型套件，专注于图像生成与编辑领域，且声称在速度上远超当前市场上的主流竞争对手。

图像套件 kontext bfl kontext套件 2025-05-31 10:18 10

中移软件申请模型训练及图像重建相关专利，可进行图像重建

国家知识产权局信息显示，中移(苏州)软件技术有限公司;中国移动通信集团有限公司申请一项名为“模型训练方法、图像重建方法、相关装置、设备、存储介质及计算机程序产品”的专利，公开号CN120070856A，申请日期为2025年01月。

软件训练模型图像专利 2025-05-31 10:01 8

BFL推出FLUX.1 Kontex模型套件，革新AI图像生成技术

科技媒体 WinBuzzer 昨日（5 月 30 日）发布博文，报道称 Black Forest Labs（BFL）推出全新 AI 模型套件 FLUX.1 Kontext，专注于生成与编辑上下文图像，号称速度比主流竞争对手快一个数量级。

模型图像套件 bfl kontex模型 2025-05-31 09:56 10

10%提升！RICO如何解决图像描述生成的老问题？

在2025年5月28日发布的arXiv预印本论文《RICO: Improving Accuracy and Completeness in Image Recaptioning via Visual Reconstruction》中，研究者提出了一种突破性的图

模态图像 rico dpo 预印本 2025-05-30 23:56 8

实现GPT4o图像生成编辑能力BFL推出新一代多模态图像生成与编辑

只能通过文字控制，无法灵活结合图片作为上下文；无法连续编辑或保留角色特征，缺乏“认知连续性”；局部编辑需要复杂遮罩或 finetuning；多轮操作后常常图像退化（失真、风格丢失）；编辑速度慢，无法满足实时交互需求。

模态图像 gpt4o 模态图像 bfl 2025-05-30 17:41 9

AI生图大洗牌！流匹配架构颠覆传统，单模型同时接受文本图像输入

新模型FLUX.1 Kontext使用流匹配架构（Flow Matching），不再是文本编码器和扩散模型各干各的，与此前技术都不同。

模型架构图像绿龙 kontext 2025-05-30 16:54 7